引言
海洋监测、理论研究、数值模拟与系统仿真是海洋学家认识海洋的三大技术手段。超级计算机的出现,成为支撑这些手段的核心要件,也是实现“透明海洋”向“智慧海洋”国家发展战略迈进的必备科学装置。
美国、日本、欧洲等国家和地区,不断地追求全球领先的超算性能的重要驱动力之一,就是为了各自国家和地区的海洋利益的计算需求。21世纪初,日本研制的地球模拟器超级计算机、美国研制的世界首台千万亿次超级计算机等都曾经是全球最快的超级计算机,均首先用之服务于本国的海洋战略。随着海洋观测手段的发展和海洋科学与数据科学等的深入交叉融合,海洋科学研究对计算能力的需求持续增加。超级计算机的计算能力从目前的Peta级提高到Exa级1(E级)势在必行。青岛海洋科学与技术国家实验室(简称“海洋国家实验室”)是代表我国海洋科技创新的重要战略部队,E级超算也将成为我国认知海洋、服务国家海洋战略必不可少的国之利器。
E级超算需求分析
E级超算以服务重大科技计划为核心任务,将充分发挥其重大科学装置的基础支撑作用,推动国家海洋科技发展,落实“海洋强国”战略。在建设之初,对海洋科学各研究领域包括透明海洋、深海极地、蓝色生命、蓝色智库和蓝色装备等科研战略任务的计算需求的调研与分析,将为其建设及建成后的高效利用提供有力保障。
作为海洋国家实验室,E级超级计算机是其必不可少的大科学装置。它对实施透明海洋、深海极地、蓝色生命等大科学计划,快速占领全球海洋科研制高点,具有重要支撑作用。我国对E级超级计算机建设,坚持按需建设、统筹规划的工作思路,围绕科研任务中的重大计算需求,融合科学计算、智能计算、知识计算、大数据计算等先进信息技术,深度进行海洋、生命、地质、信息等多学科间交叉融合创新。
E级超级计算机的研发和建设围绕全球气候变化、海洋数值模拟、生物医药仿真等具有重大计算需求的科研任务,改进和研发具有自主知识产权的E级超算工具软件和应用软件系统,构建良好的E级超算软硬件生态环境,建立国际一流的亚公里级“超高精度全球海洋系统计算仿真平台”,重点包括透明海洋、深海极地、蓝色生命、蓝色智库和蓝色装备等战略科研任务。
其中,透明海洋着重围绕海洋动力过程与全球气候、海洋环境数值模拟和海洋声、电磁等方面开展超高分辨率(亚公里级)的大气-陆面-海洋-海冰-生态等多圈层耦和模式、甚高分辨率区域浪-潮-流-内波耦合模式和高精度海洋声场、电磁场和能量场的仿真研究;深海极地着重围绕海洋地质和海洋矿产等方面开展地质演变仿真和能源勘探数据成像与反演等研究;蓝色生命着重围绕蓝色基因、蓝色药物和蓝色蛋白开展基因测序与表达仿真、分子动力学与高通量筛选和高通量蛋白活性成分分析等研究;蓝色智库着重围绕海洋大数据智能计算等开展机器智能技术和类脑智能技术等研究;蓝色装备着重围绕海洋工程材料等开展大洋钻探船的设计与仿真等研究。
透明海洋:海洋动力过程与全球气象数值模拟计算需求
海洋动力过程模拟与系统仿真,是以海洋科学与理论为基础,结合计算机信息技术,利用系统模型对海洋水体与大气圈、岩石圈和生物圈的相互作用进行的动态仿真研究。它的特点是,集成先进的监测手段和最新的理论研究成果,不断推进对海洋的科学认识和海洋环境预报预测技术的进步,从而提高海洋环境预报预测的性能。准确性和及时性是海洋环境数值预报系统的重要衡量指标。一方面,对中尺度、次中尺度和大涡模拟的需求日益增加,模式的时空间分辨率需要不断提高,以获取更加精细的物理现象。另一方面,由于计算机的能力限制和对各类物理现象的认知程度较低,海洋数值模式被分为若干相互独立发展的模式,如海浪模式、海洋环流模式、潮汐潮流模式、内波模式、海冰模式等。而实际上,海洋是复杂的多运动形态耦合系统,各种运动相互影响,只有研究分析各类海洋模式之间的相互耦合机理并实现相应的耦合过程,才能提升海洋环境数值预报准确性。一般来讲,水平分辨率每提升1倍,模式的计算量要增加10倍以上。目前在海洋国家实验室超算平台进行满载测试的(1/10)°2全球海洋数值模型,计算一天能够得到5个模式年3的数据,如果要实现2万年的模拟数据,至少需要进行4000天(约11年)的计算时长。若使用E级超级计算机,所需的时间将大大缩短至数十日乃至数日,而且,还能够允许科研人员将海洋模型的分辨率提高到(1/128)°,这将使全球范围内的亚公里级海洋模拟分析研究成为现实。
在国际舞台上,依托E级超算,通过研究制定的全球开放机制和正在构建的协作共享网络,可以为国内科学家发起全球气候变化、碳排放等国际大科学计划提供有力保障,提升中国科学家的国际话语权。
深海极地:海洋地质过程与能源勘探计算需求
海洋地质学是研究海洋中固体地球表层物质组成、地质构造和演化规律的一门综合性学科,其根本任务在于认识海底,解决陆地资源的不足,减轻地质灾害所造成的损失,从而保证经济、社会的可持续发展。在海洋地质学中,最重要的研究核心是解析海底地质过程形成和演化的动力学机制问题,包括海底地形地貌演变、构造变动、物质与能量的迁移转化等过程的时空演化规律。之前受计算能力的限制,大部分地球动力学数值模拟都是大尺度的,很少涉及精细的地质过程。然而,对地球系统运行机制的探索,只有穿越不同时间、不同空间才能成功,重建各级时间、空间尺度的构造过程显得尤为迫切。比如,在5PFlops4计算能力下,进行高密度采样并对500平方公里地质可视化仿真需要大约200小时,我国海岸带面积约为50万平方公里,因此,对其进行高精度仿真模拟的计算只有提高至E级才能实现。
地球物理勘探是实现海底能源与矿产资源精确探测的主要技术手段,也是研究地球深部构造的重要工具。目前,我国海洋地球物理勘探所面临的主要挑战是深海和深远海的复杂构造和复杂岩性问题,解决这些难题的有效方法是以高密度、宽方位、立体采集和海底地震等为代表的新型物探技术,而在这些新的观测方式下对实测数据的高精度成像与反演是上述技术能够真正发挥作用的关键。这些技术全部具有巨大的运算量与存储量,必须借助具有E级计算能力的超级计算机才能实现深海条件下复杂构造和复杂岩性的精确勘探。
蓝色生命:海洋生命科学计算需求
超级计算机在生命科学的基因组学、转录组学、蛋白质组学以及多组学的研究中发挥了巨大作用。
海洋蕴含了地球大部分的基因资源。目前,已发现的海洋生物达两万余种,单个生物的基因组就会产生TB级的原始文件,这些文件包含大量的非结构化、分散的科学数据。对如此庞大规模的数据进行分析迫切需要E级超算计算能力。
海洋药物方面,基于高性能计算的药物筛选已经成为药物设计的重要步骤之一,通过将高性能计算与药物设计相结合可以大大提升高通量筛选的效率以及成功率。借助于超级计算机,可以提升药物筛选中的分子动力学模拟的时间精度和空间精度。在P级计算能力下,实现几百个原子体系的纳秒级分子对接,往往需要几天时间,而海洋药物计划中需要实现的是35000个海洋药物小分子与靶点进行对接,这些靶点包括FDA批准药物对应的近900个靶点及其他约2000个靶点,如果没有E级超算是不可能实现的。
蛋白质组研究是继人类基因组计划中基因组序列测绘之后生命科学领域的另外一个重要课题。蛋白质组研究的计算工作主要有蛋白质折叠和蛋白质结构预测。蛋白质折叠是通过蛋白质的氨基酸序列计算蛋白质的空间结构。提取氨基酸的序列顺序信息是一项非常困难的工作,一个长度为500个氨基酸残基的蛋白质,不同的顺序组合数将会是20500,运算量超过10649。在P级计算下,这样一个简单的蛋白质组装需要经过约一个小时才能实现纳秒级别的模拟,复杂的折叠将耗用更多的时间。同时,由于蛋白质数据库的建设涵盖海量的蛋白质,需要对其结构进行计算模拟,计算量相当大,当前的P级超算均无法满足研究计算需求,亟须更大规模的E级超算提供计算支撑。
蓝色智库:海洋智能计算与大数据计算需求
随着海洋数据观测和传输技术的发展,海洋数据资源呈爆炸式增长,将智能计算技术应用于海洋大数据的分析与挖掘已成为海洋数据处理和应用的重要手段。海洋大数据具有产生速度快、多源异构、体量大等特点,对其分析与挖掘离不开超级计算机的支持。
对于海洋大数据,智能计算技术研究面向开放的、自适应的、可演化的、可计算的计算技术。目前,智能计算技术已在赤潮预测、气象数值预报、生态环境分析、海表盐度模型、水产养殖布局等诸多海洋科学领域发挥了重要的作用。根据所使用的数据和方式的不同,智能计算技术可以分为智能驱动和数据驱动两类。智能驱动技术侧重于从数据中学习出规律模型,用于对新问题的判断和预测;数据驱动侧重于从数据中挖掘关联,并以此对新问题进行预测。智能计算技术的发展为海洋领域数据分析与挖掘提供了更多契机,也对超级计算提出了更高的需求。
蓝色装备:海洋工程材料计算需求
海洋工程是指以勘测、开发和利用海洋资源为目的而建设的工程设施与装备,包括石油和天然气勘探开采平台、水下运载装备、大洋钻探船、海洋浮标、海岸防护工程等。高性能的计算机仿真与辅助设计对海洋工程领域的产品设计、测试和安全维护等各个阶段起着至关重要的作用。很多海洋工程装备体积巨大、造型复杂且对分析精度要求高,结合海上复杂的非线性流体、机、电、液交叉的环境,综合分析时具有巨大的计算量。利用E级超算中心强大的计算能力,建立超算环境下的海洋工程装备仿真平台,可以帮助模拟复杂的海上环境工况,并在几分钟或几小时内对数千种设计方案与极端海况进行仿真和测试,分析结构疲劳与安全系数,从而提高海洋工程装备的设计质量,节省设计时间和成本。
未来展望
E级超算对我国实施海洋领域内的大科学计划,快速占领全球海洋科研制高点,高效服务国家海洋战略具有重要的现实意义。我国在超级计算机技术领域已位于世界前列,继“天河二号”之后,由国家并行计算机工程技术研究中心研制的、采用纯国产核心技术的“神威·太湖之光”以125PFlops的峰值再次在世界超算排名中拔得头筹并蝉联冠军,为我国E级超级计算机的研发奠定了坚实的基础。
由于海洋国家实验室对超算持续的巨大需求,我们将根据运行一代(P级,千万亿次级/秒)、在研一代(E级,百亿亿次级/秒)、预研一代(Z级,十万亿亿次级/秒)、规划一代(Y级,亿亿亿次级/秒)的思路开展建设。在未来Z级超级计算机的建设上,我们将以智能芯片为主,构建新的网络体系架构,做高效的新一代Z级智能超级计算机。在Y级超级计算机的建设上,我们将立足电子技术,紧跟量子技术,同时依托海洋国家实验室对生物技术的系统深入研究,瞄准生物技术,为持续满足海洋计算需求,服务国家重大战略计划提供重要支撑。 ■
脚注
1 Peta级:每秒千万亿(1015)次浮点运算能力,Exa级:每秒百亿亿(1018)次浮点运算能力。
2 对应10公里级的模拟精度。
3 海洋数值模拟中,若模拟数据的时间跨度是一年则称为一个模式年。
4 每秒5千万亿次浮点运算。
其他作者:贾东宁 潘景山 张云泉
所有评论仅代表网友意见